當 AI 開始「改變想法」：AI筆記Google、NVIDIA、ByteDance 同時押注的下一場人工智慧革命

在日常生活中，人類幾乎每分鐘都在做一件事：根據新資訊調整自己的判斷。

如果你正在規劃旅行，一開始可能認為「時間最重要」。
但當你看到價格差距很大時，可能會突然改變想法：「其實便宜比較重要。」

這種行為看似理所當然，但對於現代大型語言模型（LLM）來說，卻是一個極為困難的能力。

即使是目前最強大的模型，例如

Gemini
GPT‑4
LLaMA

在某些情況下仍然無法像人類一樣 逐步更新信念（belief updating）。

這個問題長期困擾 AI 研究界。

而最近，Google 的研究團隊提出了一個可能的解決方案：讓 AI 學習「機率推理」。

這項突破，正好與另外兩個重大趨勢同時出現：

AI 開始能在 手機端運行
AI 開始能 自主完成整個專案

這三條技術路線交織在一起，正在形成一個新的 AI 時代。筆者透過 AIMochi 筆記工具，來看看 AI 圈的最新近況!

AI 的致命缺陷：大型語言模型不會更新信念

大型語言模型之所以強大，是因為它們可以模仿語言模式。

透過訓練數以兆計的文字資料，模型能夠：

撰寫文章
生成程式碼
翻譯語言
回答問題

但研究人員發現一個奇怪的現象：模型在互動中往往無法持續學習。

在一項實驗中，研究人員設計了一個簡單的情境：AI 需要幫使用者推薦航班。

每個航班都有不同特徵，例如：

價格
飛行時間
轉機次數

AI 的任務是觀察使用者選擇，推測對方的偏好。

理論上，如果使用者多次選擇「最便宜」的航班，AI 應該逐漸理解：

這位使用者重視價格。

然而實驗結果卻顯示：

大部分模型只在第一次互動後略微改善，之後就停止學習。

研究人員將這種現象稱為：

「一次性平台期（one-shot plateau）」

換句話說，AI 在理解使用者方面幾乎沒有持續進步。

解方：讓 AI 學會貝葉斯推理

為了理解理想的學習方式，研究人員將語言模型與另一種系統進行比較。

這種系統並不是神經網路，而是一個數學模型：

Bayes' theorem

貝葉斯推理的核心概念是：

每當有新證據出現，就更新機率分布。

舉例來說：

如果 AI 一開始認為：

使用者重視價格：50%
使用者重視時間：50%

當使用者多次選擇便宜航班後，機率會逐漸變成：

價格：80%
時間：20%

這種方法在統計學與機器學習領域已經使用數十年。

令人驚訝的是：這種簡單的數學模型，表現比大型語言模型更好。

Google 的新方法：讓 AI 模仿推理過程

研究團隊提出了一個巧妙的方法。

他們並沒有直接教模型答案，而是讓模型學習：

如何進行推理。

這種方法被稱為：

Bayesian Teaching

傳統 AI 訓練方式是：

老師知道答案
→ 模型模仿答案

而在新方法中：

老師也可能不知道最終答案。

但老師會展示：

推理過程
假設更新
機率變化

研究團隊將這些資料用於 監督式微調（Supervised Fine-Tuning）。

訓練對象包括：

Gemma
LLaMA

結果非常驚人。

模型與最佳貝葉斯策略的吻合度達到：約 80%

更重要的是，模型開始展現真正的 信念更新行為。

AI 的推理能力甚至超過人類

研究人員進一步測試模型的泛化能力。

新的測試包括：

飯店推薦
電子商務商品選擇
更多決策變數

令人意外的是：

模型在某些情境下 甚至超越人類參與者。

原因其實很簡單。

人類並不是完全理性的決策者。

我們常常：

分心
改變主意
行為不一致

而經過數學推理訓練的 AI，反而更接近「理性決策模型」。

這顯示一個重要方向：

AI 未來可能結合神經網路與符號推理。

另一條戰線：AI 開始在手機上運行

與此同時，Google 也在解決另一個問題：

如何讓 AI 直接在手機上運行。

為此，Google 推出了：

TensorFlow 2.21 以及新的推理引擎 LiteRT

LiteRT 是過去 TensorFlow Lite 的升級版本。

它的目標是：

讓 AI 在小型設備上運行得更快。

改進包括：

GPU 推理速度提升約 1.4 倍
更好的 NPU 支援
更簡單的模型部署流程

關鍵技術：模型量化

手機運行 AI 最大問題是：

記憶體
電力
計算能力

解決方法之一是：

模型量化（Quantization）

簡單來說，就是：

把高精度數字壓縮成更小格式。

這樣可以：

減少模型大小
提高運行速度
降低耗電

結果是：

更大的 AI 模型可以在手機端運行。

這意味著未來很多 AI 功能將不需要雲端。

AI 的第三條路：自主代理系統

除了推理能力與裝置端 AI，另一個快速崛起的領域是：

AI Agent

近期，ByteDance 發布了開源框架：

DeerFlow

這個系統的核心概念是：

多代理協作

一個任務可以被拆分為多個子任務：

例如：

收集資料
分析數據
生成圖表
製作簡報

不同代理同時工作，最後合併結果。

更重要的是：

DeerFlow 代理可以：

運行程式碼
執行命令列
存取檔案

換句話說：

AI 不只是建議，而是 真正執行任務。

NVIDIA 的計畫：AI 員工

同時，NVIDIA 正準備推出企業代理平台：

NemoClaw

該平台預計在 NVIDIA GTC 開發者大會公布。

根據媒體報導，NemoClaw 的目標是：

讓企業部署能替員工工作的 AI 代理。

可能合作公司包括：

Salesforce
Cisco
Adobe

平台將強調：

安全性
隱私控制
企業級部署

這顯示 AI 正逐漸從工具變成：勞動力。

AI 可能正在成為「數位員工」

過去幾年，大多數人認為 AI 的未來是：

聊天機器人。

但現在的發展方向顯示另一種可能：

AI 將逐漸變成一種 工作系統。

它能：

推理
執行任務
自主完成專案

當這三項能力結合時，一個新的經濟模式可能出現：

AI Agent Economy

在這個世界裡，企業不只是雇用人類。

還會雇用：

人工智慧代理。

而這場變革，或許才剛剛開始。

以上僅供參考與資訊分享之用!若想快速了解更多資訊，透過 AIMochi 筆記工具，幫我們從海量資料中，梳理出關鍵資訊，讓我們精準掌握重要訊息!

| 馬上開始使用AIMochi